Listen Top Shows Blog

[142] השקרים שUMAP מספר לנו

[142] השקרים שUMAP מספר לנו

Update: 2025-12-08

Share

Description

למה תמיד כשאנחנו משתמשים בUMAP, קלאסטרים עם אותה כמות נקודות נראים באותו הגודל?

השבוע ב-explAInable, מייק והילה צללו לשיטת הויזואליזציה UMAP, שנחשבת לחדשנית ביותר בתחום ומשמשת רבים מאיתנו בהדמיה של נתונים ממימד הגבוה למרחב הטלה של דו-מימד (או תלת-מימד). ניתחנו את משמעות השם של השיטה, ובדקנו איך הנחת התפלגות האחידה שלנו המהווה את הבסיס להטלה במימד הנמוך יכולה לשבש לנו את התוצאות.

האם אנחנו באמת יכולים לסמוך על צפיפות הנקודות במרחב ההטלה, האם יכול להיות שאנומליות ימסו לנו לקלאסטרים המרכזיים? כל זאת ועוד - בפרק!

לינק לקוד הפתוח של UMAP, שכולל הטמעה של densMAP:

https://github.com/lmcinnes/umap

לינק למאמר של UMAP בארכיב (עדכון אחרון של המאמר ב-2020):

https://arxiv.org/abs/1802.03426

בואו להתארח אצלנו כמומחים בפרקים הבאים:

https://forms.gle/JQM2zTmeY6cp58AA9

פרקים

00:00 מתי קווים מקבילים יפגשו?

00:51 היי UMAP, שמור לי על שכנים קרובים ונקודות רחוקות בבקשה!

02:26 החשיבות העסקית של ויז׳ואליזציות בעלות משמעות

03:19 עושים decoding לשם השיטה.

04:55 איך UMAP עובד מתמטית

07:54 אוי לא, הנחת ההתפלגות האחידה מסבכת אותנו!

08:46 האם הויזואליזציות שאנחנו מייצרים משקרות לנו?

11:00 שיפורים של UMAP להתמודדות עם צפיפות משתנה

Comments

In Channel

[115] על RLHF ומודלי שפה גדולים

[115] על RLHF ומודלי שפה גדולים

2025-04-1955:10

[126] איך עושים מחקר ופיתוח בעולם ה-GenAI עם עוז ליבנה

[126] איך עושים מחקר ופיתוח בעולם ה-GenAI עם עוז ליבנה

2025-07-2858:15

[125] על חוקי הסקייל של מודלי שפה עם ד״ר ג׳וני רוזנפלד מMIT

[125] על חוקי הסקייל של מודלי שפה עם ד״ר ג׳וני רוזנפלד מMIT

2025-07-2001:08:31

[124] איך מאמנים מודלים לשכוח - עם פרופ עודד שמואלי

[124] איך מאמנים מודלים לשכוח - עם פרופ עודד שמואלי

2025-07-1236:35

[117] חיפוש והמלצה 2025 - חוזרים אחורה - סיכום כנס הייסטאק

[117] חיפוש והמלצה 2025 - חוזרים אחורה - סיכום כנס הייסטאק

2025-05-0434:48

[123] על דיפ לרנינג, דאטא טאבולרי וTabStar עם אלן ארזי

[123] על דיפ לרנינג, דאטא טאבולרי וTabStar עם אלן ארזי

2025-06-2733:31

[122] על הקשר בין דחיסה ללמידה עם פרופ. רביד זיו

[122] על הקשר בין דחיסה ללמידה עם פרופ. רביד זיו

2025-06-1556:00

[121] על אומנות ובינה מלאכותית גנרטיבית - עם מתי מריאנסקי

[121] על אומנות ובינה מלאכותית גנרטיבית - עם מתי מריאנסקי

2025-06-0751:28

[119] איך הגעתי למליוני חשיפות בלינקדין עם AI - עם מיכאל קיסילנקו

[119] איך הגעתי למליוני חשיפות בלינקדין עם AI - עם מיכאל קיסילנקו

2025-05-1941:23

[114] קבלת החלטות ארוכות טווח עם פרופ. גיא שני

[114] קבלת החלטות ארוכות טווח עם פרופ. גיא שני

2025-04-1032:59

[128] AI Coding - עם גילי נחום - AWS

[128] AI Coding - עם גילי נחום - AWS

2025-08-2037:48

[120] איך מודלי שפה עובדים טוב גם לא באנגלית - עם גיא רוטמן, גונג

[120] איך מודלי שפה עובדים טוב גם לא באנגלית - עם גיא רוטמן, גונג

2025-05-2749:27

[118] מענה על שאלות חזותיות VQA - עם פרופ עידן שוורץ

[118] מענה על שאלות חזותיות VQA - עם פרופ עידן שוורץ

2025-05-1201:02:10

[113] NVIDIA GTC 2025 - סיכום הכנס

[113] NVIDIA GTC 2025 - סיכום הכנס

2025-03-3028:26

[112] בעקבות המאמר של מטא עם לירון יצחקי אלרהנד

[112] בעקבות המאמר של מטא עם לירון יצחקי אלרהנד

2025-03-1944:16

[144] מדיה גנרטיבית בגוגל עם שי אלון

[144] מדיה גנרטיבית בגוגל עם שי אלון

2025-12-2338:27

[143] זוויות של בינה מלאכותית עם ד״ר אלישע רוזנצוויג

[143] זוויות של בינה מלאכותית עם ד״ר אלישע רוזנצוויג

2025-12-1549:26

[142] השקרים שUMAP מספר לנו

[142] השקרים שUMAP מספר לנו

2025-12-0817:20

[141] מולטי-מודאליות ב-IBM: איך מאמנים מודלי Vision-Language, עם ד״ר אלי שוורץ

[141] מולטי-מודאליות ב-IBM: איך מאמנים מודלי Vision-Language, עם ד״ר אלי שוורץ

2025-12-0136:40

[140] סלאשרים של בינה מלאכותית: איך המובילים בתעשייה שלנו משלבים חדשנות מחקרית עם נורית כהן אינגר

[140] סלאשרים של בינה מלאכותית: איך המובילים בתעשייה שלנו משלבים חדשנות מחקרית עם נורית כהן אינגר

2025-11-2441:52

00:00

00:00

x

[142] השקרים שUMAP מספר לנו

[142] השקרים שUMAP מספר לנו

Tamir Nave, Mike Erlihson & Uri Goren